home *** CD-ROM | disk | FTP | other *** search
/ The CICA Windows Explosion! / The CICA Windows Explosion! - Disc 2.iso / nt / ntkb.zip / NTKB.EXE / Q99 / 8 / 84.TXT < prev    next >
Text File  |  1994-01-24  |  5KB  |  112 lines

  1. DOCUMENT:Q99884  20-JAN-1994  [W_NT]
  2. TITLE   :Unicode and Microsoft Windows NT
  3. PRODUCT :Windows NT
  4. PROD/VER:3.10
  5. OPER/SYS:WINDOWS
  6. KEYWORDS:
  7.  
  8. ----------------------------------------------------------------------
  9. The information in this article applies to:
  10.  
  11.  - Microsoft Windows NT operating system version 3.1
  12. ----------------------------------------------------------------------
  13.  
  14. Summary:
  15.  
  16. Windows NT version 3.1 employs a relatively new standard of character
  17. representation called Unicode. This new standard allows for greater
  18. flexibility in adding support for localized versions of Microsoft
  19. Windows NT.
  20.  
  21. More Information:
  22.  
  23. The first and most prominent character standard in use by computers
  24. today is ASCII. This format is adequate for western languages, but as
  25. computers became more popular in European countries, the limitations
  26. of ASCII became clear.
  27.  
  28. In an effort to overcome some of these limitations, the International
  29. Standards Organization (ISO) established a new standard called Latin-1
  30. that defined European characters that were omitted from ASCII.
  31. Microsoft Windows modified the Latin-1 standard even further and
  32. called the character set Windows ANSI. However, by continuing use of
  33. an 8-bit coding scheme, ASCII is only capable of representing 256
  34. unique symbols--considerably less than the 10,000 symbols that are
  35. common in such languages as Cyrillic, Chinese, Korean, and Japanese.
  36. In addition to the language barriers, as the capabilities of computers
  37. broaden beyond uppercase, monospaced fonts, the requirements for a
  38. large set of unique characters (for example,letters, punctuation,
  39. mathematical and technical symbols, and publishing characters) have
  40. also grown far beyond the capabilities of 8-bit text.
  41.  
  42. The lowest level of localization (adaptation to a particular language)
  43. is the actual binary representation of characters: the code set. To
  44. overcome the limitations of the other coding methods, several major
  45. computer companies, including Apple Computer, Inc., Sun Microsystems,
  46. Inc., Xerox Corp., and IBM (International Business Machines Corp.),
  47. formed Unicode Inc., a non-profit consortium, to set out to define a
  48. new standard for international character sets. At the same time, the
  49. ISO began developing a standard. Eventually, these standards merged
  50. and became Unicode. Unicode is published as The Unicode Standard,
  51. Worldwide Character Encoding.
  52.  
  53. Unicode employs a 16-bit coding scheme that allows for 65,536 distinct
  54. characters--more than enough to include all languages in use today. In
  55. addition, it supports several archaic or arcane languages such as
  56. Sanskrit and Egyptian hieroglyphs. Unicode also includes
  57. representations for punctuation marks, mathematical symbols, and
  58. dingbats, with room left for future expansion. Because it establishes
  59. a unique code for each character in each script, Windows NT can ensure
  60. that the character translation from one language to another is
  61. accurate.
  62.  
  63. Unicode in Windows NT
  64. ---------------------
  65.  
  66. Unicode is the native code set of Windows NT, but the Win32 subsystem
  67. provides both ANSI and Unicode support. Character strings in the
  68. system, including object names, path names, and file and directory
  69. names are represented with 16-bit Unicode characters. The Win32
  70. subsystem converts any ANSI characters it receives into Unicode
  71. strings before manipulating them. It then converts them back to ANSI,
  72. if necessary, upon exit from the system.
  73.  
  74. References:
  75.  
  76. Unicode Inc.
  77. 1965 Charleston Road
  78. Mountain View, CA 94043
  79. Phone (415) 961-4189
  80.  
  81. "Inside Windows NT," by Helen Custer, Microsoft Press, 1992
  82.  
  83. "Program Migration to Unicode," by Amus Freytag, Proceedings of the
  84. First Unicode Implementers Workshop, The Unicode Consortium, Mountain
  85. View, California, August, 1991
  86.  
  87. "Adapt Your Program for Worldwide Use with Windows
  88. Internationalization Support," by William S. Hall, Microsoft Systems
  89. Journal, Vol. 6, No. 6, Nov./Dec. 1991
  90.  
  91. "Operating Systems Design and Implementation," by Andrew S. Tanenbaum,
  92. Prentice-Hall, Inc., Englewood Cliffs; New Jersey, 1987
  93.  
  94. Additional reference words: 3.10 win32
  95. KBCategory:
  96. KBSubCategory: WINNT
  97.  
  98. =============================================================================
  99.  
  100. THE INFORMATION PROVIDED IN THE MICROSOFT KNOWLEDGE BASE IS
  101. PROVIDED "AS IS" WITHOUT WARRANTY OF ANY KIND.  MICROSOFT DISCLAIMS
  102. ALL WARRANTIES, EITHER EXPRESS OR IMPLIED, INCLUDING THE WARRANTIES
  103. OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE.  IN NO
  104. EVENT SHALL MICROSOFT CORPORATION OR ITS SUPPLIERS BE LIABLE FOR
  105. ANY DAMAGES WHATSOEVER INCLUDING DIRECT, INDIRECT, INCIDENTAL,
  106. CONSEQUENTIAL, LOSS OF BUSINESS PROFITS OR SPECIAL DAMAGES, EVEN IF
  107. MICROSOFT CORPORATION OR ITS SUPPLIERS HAVE BEEN ADVISED OF THE
  108. POSSIBILITY OF SUCH DAMAGES.  SOME STATES DO NOT ALLOW THE EXCLUSION
  109. OR LIMITATION OF LIABILITY FOR CONSEQUENTIAL OR INCIDENTAL DAMAGES
  110. SO THE FOREGOING LIMITATION MAY NOT APPLY.
  111.  
  112. Copyright Microsoft Corporation 1994.